بهینه‌سازی هوش مصنوعی فقط با جمع‌آوری داده‌های کاربران ممکن است؟

مجله‌ی مادربورد در اوت امسال پرونده‌ای را به مایکروسافت و گوش‌دادن به صدای کاربران ایکس‌باکس اختصاص داد. در آن پرونده، گفته شد ردموندی‌ها برای بهبود کارایی سرویس خود، صدای ضبط‌شده‌ی کاربران را به پیمان‌کاران ارسال می‌کنند تا به آن‌ها گوش دهند. در ابتدای همان ماه، خبر مشابهی درباره‌ی گوش‌دادن به صدای کاربران اسکایپ و دستیار صوتی کورتانا منتشر شده بود. طبق ادعای پیمان‌کاران، برخی از محتوای بررسی‌شده‌ی کاربران حاوی اطلاعات بسیار شخصی آنان بود.

مایکروسافت یکی از شرکت‌های متعددی است که از نیروی انسانی برای نظارت و بررسی داده‌های کاربران استفاده می‌کند. در ماه‌های اخیر، برنامه‌های مشابهی در گوگل و آمازون و فیسبوک گزارش شده‌اند و حتی اپل که ادعا می‌کند به داده‌های کاربرانش بسیار اهمیت می‌دهد، رویکردهای مشابهی داشته است.

دستیارهای هوشمند صوتی و چت‌بات‌ها روز‌به‌روز محبوب‌تر می‌شوند. در این‌ میان، شرکت‌های فناوری با مشکل بزرگ و جدیدی روبه‌رو هستند. الگوریتم‌های هوش مصنوعی آن‌ها برای کار با پیچیدگی‌های زبانی انسان‌ها طراحی نشده‌اند؛ به‌ همین دلیل، آن‌ها عموما در درک زمینه و موضوع دستورهای کاربران با مشکل مواجه می‌شوند.

درحال‌حاضر، بهترین راه برای رفع مشکل مذکور، استخدام نیروی انسانی است که الگوریتم‌ها را به مسیر صحیح هدایت کند. برای پیاده‌سازی این راهکار نیز عموما پیمان‌کاران باید به صدای کاربران واقعی گوش دهند. آن‌ها برخی اوقات با مکالمه‌های بسیار شخصی کاربران سروکار دارند که باید به متن تبدیل شوند.

یادگیری عمیق

مسئله‌ی درک زبان

دستیارهای صوتی مبتنی‌بر صدا مانند الکسا و سیری و کورتانا به‌‌دلیل فناوری یادگیری عمیق به پیشرفت‌های کنونی دست یافته‌اند. یادگیری عمیق زیرمجموعه‌ای از هوش مصنوعی محسوب می‌شود که در سال‌های اخیر، بیش از همه در صدر اخبار بوده است. الگوریتم‌های یادگیری عمیق عموما در پیداکردن الگوهای مشابه و دسته‌بندی اطلاعات قوی هستند.

وقتی الگوریتم یادگیری عمیق میلیون‌ها صدای ضبط‌شده را به‌همراه متن هرکدام به‌عنوان ورودی دریافت می‌کند، در تبدیل مکالمه‌های جدید به متن، دقت بسیار زیادی می‌یابد. یادگیری عمیق در پیش‌بینی رخدادها نیز بسیار قدرتمند است. وقتی الگوریتم هوش مصنوعی را با داده‌های بسیار زیاد تربیت کنید، توانایی تشخیص روابط ریاضی را در ترتیب کلمه‌های هر متن و مکالمه پیدا می‌کند و درنهایت، وظایفی همچون کامل‌سازی جمله‌ها را با قدرت بیشتری انجام خواهد داد.

یادگیری عمیق با وجود همه‌ی مزایا، در درک معنی کلمه‌ها و جمله‌ها ناتوان است. چنین وظیفه‌ای هیچ‌گاه فقط با تکیه بر مهارت‌های ریاضی و آمار انجام‌شدنی نخواهد بود. گری مارکوس، دانشمند علوم شناختی و مدیرعامل شرکت Robust AI، درباره‌ی درک صحبت و فهم زبان طبیعی ازطریق هوش مصنوعی می‌گوید:

تشخیص گفتار و درک زبان طبیعی به‌نظر مشکلات مشابهی هستند؛ اما درنهایت، آن‌ها تفاوت‌های عمده‌ای باهم دارند. در تشخیص گفتار، سیلاب‌ها و واج‌های محدودی در زبان دارید. به‌علاوه، تلاش می‌کنید جریانی صوتی را به مفهومی در دسته‌بندی‌های محدود تبدیل کنید.

هوش مصنوعی

زبان انگلیسی به‌عنوان پرکاربردترین زبان جهان برای بررسی قدرت هوش مصنوعی بررسی می‌شود. درحال‌حاضر، ده‌هاهزار کلمه‌ی پرکاربرد در این زبان وجود دارد. در دوران کنونی که به‌نام «کلان‌داده» شناخته می‌شود، می‌توان به‌آسانی میلیون‌ها مثال از هریک از کلمه‌ها پیدا کرد و هوش مصنوعی را به‌‌کمک آن‌ها آموزش داد.

درمقابل درک کلمه‌ها، تجزیه و تفسیر جمله‌ها فرایندی بسیار دشوارتر خواهد بود. در موضوع تنوع جمله‌ها، می‌توان تعداد نمونه‌ها را بی‌شمار دانست که هرکدام هم معانی متفاوتی دارند. در این‌ میان، معانی کلمه‌ها هم بسته به موقعیت قرارگیری در جمله و کلمه‌های قبل و بعد متفاوت می‌شود. مارکوس درادامه‌ی صحبت‌های خود درباره‌ی درک و تفسیر جمله‌ها می‌گوید:

تقریبا تمامی جمله‌هایی که روزانه می‌شنویم، جمله‌‌ی منحصربه‌فرد محسوب می‌شوند؛ البته تعداد بسیار محدودی از آن‌ها از این قائده مستثنی هستند. درواقع، هیچ داده‌ی مستقیمی از جمله‌ها نداریم و درنتیجه، در تفسیر و درک آن‌ها با مشکل مواجه خواهیم بود. روش‌هایی که اکنون برای دسته‌بندی موارد و جانمایی آن‌ها در گروه‌های متعدد استفاده می‌شوند، برای درک جمله‌ها کاربردی نخواهند بود. درک زبان به‌‌معنای اتصال درک کنونی شما از جهان پیرامون به کلمه‌هایی است که مخاطبان برای توضیح آن به‌کار می‌برند.

آموزش هوش مصنوعی همیشه به داده‌های فراوان محتاج است

مارکوس کتاب جدیدی به‌نام Rebooting AI دارد که در آن به مشکلات درک و رمزگشایی زبان انسانی به‌وسیله‌ی هوش مصنوعی اشاره می‌کند. از توانایی‌های که ما انسان‌ها در درک جمله‌ها داریم، می‌توان به استفاده از دانش کنونی درباره‌ی جهان برای گره‌گشایی از مسئله‌ها و پیچیدگی‌های زبان نوشتاری و گفتاری مخاطبان اشاره کرد.

هوش مصنوعی

مکالمه‌های روزمره ابهام‌های زیادی دارند. به‌عنوان مثال، می‌توان به‌معنی متفاوت کلمه‌ی «در» در جمله‌های گوناکون اشاره کرد. در جمله‌ای «در» می‌تواند ورودی اتاق یا ساختمان یا هر مفهوم بسته باشد و در مثالی دیگر، «در» برای مفهوم داخل چیزی بودن استفاده می‌شود. انسان‌ها با شنیدن جمله‌های شامل این کلمه، دشواری زیادی در تشخیص مفهوم آن نخواهند داشت؛ چون ترکیب کلمه‌های قبل و بعد و شرایط گفتن جمله را درک می‌کنند.

چرخه‌ی بی‌پایان آموزش

همه‌ می‌دانیم ابزارهای یادگیری عمیق، عقل سلیم به‌معنای عقل انسانی ندارند. آن‌ها فاقد دانشی جامع از جهان هستند و شرکت‌های فناوری برای بهبود آن‌ها هیچ چاره‌ای جز افزایش آموزش با مثال‌های متنوع نخواهند داشت. درواقع، آن‌ها امیدوار هستند تمامی نمونه‌ها و انواع مثال‌های داده را به‌عنوان ورودی به الگوریتم وارد کنند تا همه‌ی آن‌ها را بشناسد؛ درنتیجه، شرکت‌ها به نیروی انسانی نیاز پیدا می‌کنند که عموما هم به‌صورت دورکار و پیمان‌کاری، وظایف را انجام می‌دهند. آن‌ها کارایی هوش مصنوعی شرکت را بررسی و اعتبارسنجی و داده‌های صوتی را به متن تبدیل می‌کنند که الگوریتم از تبدیل آن‌ها عاجز است.

درک و تفسیر جمله‌ها در زبان طبیعی، به درکی جامع از جهان هستی نیاز دارد

انسان‌ها برای توضیح انواع موضوعات، از مفاهیم و تعریف‌های گوناگونی استفاده می‌کنند و هرروز نیز به تعداد تعریف‌ها و عبارت‌ها افزوده می‌شود؛ درنتیجه، آموزش بیشتر مانند راهکاری موقت برای چالش هوش مصنوعی خواهد بود.

درواقع، همیشه مثال‌هایی وجود دارند که هوش مصنوعی برای درک آن‌ها آموزش ندیده است. پیشرفت و تکامل زبان بشری نیز همیشه ادامه دارد. تمام آنچه گفته شد، نیاز به آموزش را تشدید می‌کنند و درنتیجه، بازهم داستان‌ها و اخباری درباره‌ی گوش‌دادن نیروی انسانی به صداهای کاربران را شاهد خواهیم بود.

مارکوس درباره‌ی روش‌های کنونی تکامل هوش مصنوعی می‌گوید:

ضعف فناوری کنونی در نیاز همیشگی آن به داده دیده می‌شود؛ به‌ویژه در مسائل باز همچون درک مفاهیم زبان طبیعی، چنین نیازی بیشتر می‌شود؛ درنتیجه شرکت‌ها برای تأمین نیاز فناوری، انواع فعالیت‌ها را انجام می‌دهند. از دیدگاه من، جمع‌آوری داده‌ی بیشتر به حل مشکلات شرکت‌ها کمک نمی‌کند. شاید این رویکرد تا حدودی به کاهش مشکلات کمک کند؛ اما قطعا آن‌ها را به‌صورت کامل رفع نمی‌کند.

بدون تزریق مفهوم عقل جامع و دانش پایه‌ای به الگوریتم‌های یادگیری عمیق، نمی‌توان هیچ امیدی به حل کوتاه‌مدت مشکل آن‌ها داشت. تا وقتی شرکت‌ها برای آموزش الگوریتم‌های خود داده‌های کاربران را جمع‌آوری و تفسیر می‌کنند، باید برای واکنش شدید حامیان حریم خصوصی و اقدام‌های احتمالی قانون‌گذاران این حوزه آماده باشند. همین موارد باعث شد تعدادی از شرکت‌ها سرعت روند جمع‌آوری و تفسیر داده‌های کاربران را کاهش دهند؛ ولی به‌صورت کامل آن را متوقف نکردند.

یادگیری عمیق

اپل در اوت امسال، بیانیه‌ی عذرخواهی در وب‌سایت خود منتشر کرد که به اشتراک‌ دستورهای کاربران در سیری با پیمان‌کاران مرتبط بود. کوپرتینویی‌ها متعهد شدند تنها درصورت مشارکت مستقیم کاربر در طرح‌های آزمایشی و تحلیل داده‌ از اطلاعات او برای آموزش هوش مصنوعی استفاده خواهند کرد. گوگل هم فعالیت‌های تحلیل داده‌های کاربران را در اروپا متوقف کرده است. قوانین حفاظت از داده‌های کاربران در این قاره با جدیت بیشتری اجرا می‌شوند؛ البته برنامه‌ی اهالی مانتین‌ویو در مناطق دیگر جهان نیز ادامه دارد.

مایکروسافت هم مانند غول‌های دیگر دنیای فناوری اسناد سیاست حریم خصوصی خود را به‌روزرسانی کرد. اکنون کاربران آن‌ها می‌دانند شاید مکالمه‌ها و دستورهای صوتی‌شان را نیروی انسانی شنیده و بررسی کرده باشد. درنهایت، آمازون نیز سیاست‌های خود را تغییر و امکان خروج از برنامه‌ی تفسیر داده را به کاربران داد؛ هرچند بسیاری از آن‌‌ها به چنین امکانی توجه نمی‌کنند یا از آن اطلاع ندارند.

مارکوس اعتقاد دارد در طولانی‌مدت باید چشم‌اندازهای جدیدی در حوزه‌ی هوش مصنوعی ایجاد شود. او درپایان مصاحبه می‌گوید:

باید در حوزه‌ی هوش مصنوعی بیشتر تحقیق کنیم. درواقع، باید فرهنگ را از ساختار مبتنی‌بر داده و رباضیات به فرهنگی تبدیل کنیم که ایده‌های موجود در زمینه‌های دیگر همچون روان‌شناسی و فلسفه و زبان‌شناسی را هم بپذیرد. زمینه‌های مذکور مطالعه‌ی دقیقی درباره‌ی چگونگی فعالیت ذهن انسان کرده‌اند و احتمالا به ساختن تجربه‌های بهتر و دقیق‌تر هوش مصنوعی کمک می‌کنند.





تاريخ : یک شنبه 31 شهريور 1398برچسب:, | | نویسنده : مقدم |